18 research outputs found

    Lexicalização de ontologias : o relacionamento entre conteúdo e significado no contexto da Recuperação da Informação

    Get PDF
    Esta proposta visa representar a linguagem natural na forma adequada às ontologias e vice-versa. Para tanto, propõe-se à criação semiautomática de base de léxicos em português brasileiro, contendo informações morfológicas, sintáticas e semânticas apropriadas para a leitura por máquinas, permitindo vincular dados estruturados e não estruturados, bem como integrar a leitura em modelo de recuperação da informação para aumentar a precisão. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em português, para a elaboração da ontologia, da base léxico-semântica e da proposta do modelo de recuperação da informação semântica. Para avaliar a performance do modelo proposto, foram selecionados documentos contendo as principais definições do domínio de risco financeiro. Esses foram indexados com e sem anotação semântica. Para possibilitar a comparação entre as abordagens, foram criadas duas bases, a primeira representando a busca tradicional, e a segunda contendo o índice construído, a partir dos textos com as anotações semânticas para representar a busca semântica. A avaliação da proposta é baseada na revocação e na precisão. As consultas submetidas ao modelo mostram que a busca semântica supera o desempenho da tradicional e validam a metodologia empregada. O procedimento, embora adicione complexidade em sua elaboração, pode ser reproduzido em qualquer outro domínio.The proposal presented in this study seeks to properly represent natural language to ontologies and vice-versa. Therefore, the semi-automatic creation of a lexical database in Brazilian Portuguese containing morphological, syntactic, and semantic information that can be read by machines was proposed, allowing the link between structured and unstructured data and its integration into an information retrieval model to improve precision. The results obtained demonstrated that the methodology can be used in the risco financeiro (financial risk) domain in Portuguese for the construction of an ontology and the lexical-semantic database and the proposal of a semantic information retrieval model. In order to evaluate the performance of the proposed model, documents containing the main definitions of the financial risk domain were selected and indexed with and without semantic annotation. To enable the comparison between the approaches, two databases were created based on the texts with the semantic annotations to represent the semantic search. The first one represents the traditional search and the second contained the index built based on the texts with the semantic annotations to represent the semantic search. The evaluation of the proposal was based on recall and precision. The queries submitted to the model showed that the semantic search outperforms the traditional search and validates the methodology used. Although more complex, the procedure proposed can be used in all kinds of domains

    Lexicalização de ontologias : o relacionamento entre conteúdo e significado no contexto da recuperação da informação

    Get PDF
    Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2015.Investiga as tecnologias da Web Semântica e as técnicas de Processamento de Linguagem Natural para a elaboração semiautomática de uma base léxico-ontológica, em Português, circunscrita ao domínio de risco financeiro que, incorporada ao modelo de recuperação da informação, visa melhorar a precisão. Identifica teorias, ferramentas e técnicas que propiciam a automatização de procedimentos que extraem elementos ontológicos e léxicos de bases estruturadas e não estruturadas. Esses elementos combinados na forma de base de dados apoiam a geração de índice léxico-semântico que fornece insumos para a proposição de modelo de recuperação da informação semântica. A metodologia adotada se apresenta em: levantamento de fundamentos teóricos e metodológicos, ferramentas e bases de dados ontológicas e textuais; construção de ontologia e base léxico-ontológica com foco no risco financeiro; elaboração de modelo de recuperação da informação semântica; avaliação do modelo realizada num corpus de informação relacionada ao risco financeiro que foi indexado nos moldes tradicionais e contemplando a informação semântica para, então, medir a precisão nas duas situações. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em Português, para a elaboração da ontologia OntoRisco, da base léxico-semântica RiscoLex e da proposta de modelo de recuperação da informação semântica que mostrou resultados superiores aos modelos de recuperação da informação tradicionais, nos testes realizados. Conclui que os resultados satisfatórios mostram a aplicabilidade da proposta metodológica para o domínio em questão e aponta para a possibilidade de expandir a outros domínios com as devidas adaptações dos recursos utilizados. O estudo contribui para a área de representação e organização da informação e do conhecimento na medida em que fornece metodologia, aporte teórico e insumos para que profissionais continuem promovendo o desenvolvimento da Ciência da Informação.This research investigates Semantic Web technologies, and Natural Language Processing techniques in order to semi automatically develop a lexicon-ontological database in Portuguese. This base is intended to improve the precision measurement in the financial risk domain by coupling it into an information retrieval model. It identi This research investigates Semantic Web technologies, and Natural Language Processing techniques in order to semi automatically develop a lexicon-ontological database in Portuguese. This base is intended to improve the precision measurement in the financial risk domain by coupling it into an information retrieval model. It identifies theories, tools and techniques that allow the automation of procedures that extract ontological and lexical elements from structured and non-structured databases. When these lexical and ontological elements are together in a database format, they give support to the generation of lexico-semantic index that can help the creation of semantic information retrieval models. The methodology used is as follows: surveys of methodological and theoretical fundamentals, tools, as well as ontological and textual databases; creation of an ontology and a lexicon-ontology base in the financial risk domain; elaboration of semantic information retrieval model; evaluation of the model using an information corpus related to financial risks – it was indexed by using traditional techniques, i.e. keywords, and also using semantic information; and then the precision of both situations was finally measured. The results achieved demonstrate the methodology used in the financial risk domain to elaborate the ontology, OntoRisco, using the lexico-semantic database, RiscoLex, and the semantic informational retrieval model proposed in this work. In the tests executed, the results were better than those presented by using traditional information retrieval models. It concludes that the results were quite satisfying since they show the applicability of the methodological proposal to the financial risk domain. In addition, it points the possibility of extending the proposal to other domains with only some adaptations.es theories, tools and techniques that allow the automation of procedures that extract ontological and lexical elements from structured and non-structured databases. When these lexical and ontological elements are together in a database format, they give support to the generation of lexico-semantic index that can help the creation of semantic information retrieval models. The methodology used is as follows: surveys of methodological and theoretical fundamentals, tools, as well as ontological and textual databases; creation of an ontology and a lexicon-ontology base in the financial risk domain; elaboration of semantic information retrieval model; evaluation of the model using an information corpus related to financial risks – it was indexed by using traditional techniques, i.e. keywords, and also using semantic information; and then the precision of both situations was finally measured. The results achieved demonstrate the methodology used in the financial risk domain to elaborate the ontology, OntoRisco, using the lexico-semantic database, RiscoLex, and the semantic informational retrieval model proposed in this work. In the tests executed, the results were better than those presented by using traditional information retrieval models. It concludes that the results were quite satisfying since they show the applicability of the methodological proposal to the financial risk domain. In addition, it points the possibility of extending the proposal to other domains with only some adaptations

    Descoberta de Conhecimento em Texto aplicada a um Sistema de Atendimento ao Consumidor

    Get PDF
    Analisa um Serviço de Atendimento ao Consumidor de instituição financeira que centraliza, em forma textual, os questionamentos, as reclamações, os elogios e as sugestões, verbais ou escritas, de clientes. Discute a complexidade da informação armazenada em linguagem natural e oferece alternativa para extração de conhecimento de bases textuais com a criação de agrupamentos e modelo de classificação automática de textos para agilizar a tarefa realizada atualmente por pessoas. Apresenta uma revisão de literatura que mostra a Descoberta de Conhecimento em Texto como uma extensão da Descoberta de Conhecimento em Dados que utiliza técnicas do Processamento de Linguagem Natural para adequar o texto ao formato apropriado para a mineração de dados e destaca a importância do processo na Ciência da Informação. Aplica a Descoberta de Conhecimento em Texto na base do Serviço de Atendimento ao Consumidor com objetivo de criar automaticamente agrupamentos de documentos para posterior criação de um modelo categorizador automático dos novos documentos recebidos diariamente. Essas etapas são validadas por especialistas de domínio que atestam a qualidade dos agrupamentos e do modelo. Finalmente, geram-se indicadores de desempenho do grau de satisfação do cliente referente a produtos e serviços oferecidos que subsidiam a gestão na política de atendimento

    Ten years of ElPub : an analysis of its major trends

    Get PDF
    Electronic publishing constitutes one of the hottest topics discussed amongst researchers from a variety of disciplines since the seminal work by Harnad, in the 1980's, “The scholarly skywriting”, when its potentialities started to challenge the well-established business model of commercial publishers. It was certainly in this context that the first ElPub thinkers initiated the conference. In fact, the International Conference on Electronic Publishing (ElPub) is the realisation of an idea that was brought into reality in 1997 by a group of librarians, including the most persistent ElPubers Peter Linde and John Smith. In its very beginning, ElPub only comprised the presentation of papers. In 1999, there were two panel debates whose speakers were invited to participate and received grants from the conference for that. Over the subsequent years, ElPub has gradually incorporated features of greater, well-established international conferences. Especially since 2003, a variety of sessions started to be part of the conference programme, annually organised in two tracks, namely general and technical. Those sessions comprise: special sessions focusing on a specific topic and sponsored by a specific organisation, workshops - mostly on technical aspects of electronic publishing -, posters and demonstrations. A gradual increasing variety of topics has also been defined in the Call for Papers of the conference, as constituents of the topic. Since then, ElPub has covered a number of interesting topics, presented by people from ca. 44 countries so far

    Ontologia: o termo e a idéia

    No full text
    Aborda o conceito de Ontologia e relaciona alguns problemas que motivam os pesquisadores desta área. Contextualiza a sobrecarga informacional em virtude do crescente volume de texto eletrônico armazenado em bases de dados, em especial na Web, e sua implicação na manutenção do fluxo da informação. Além disso, introduz a idéia da Web Semântica como uma solução para a organização dos conteúdos das páginas nos sítios da Web e o papel preponderante das ontologias, dentro deste contexto, que auxiliam a automatização da interpretação destes conteúdos e otimiza a recuperação da informação

    Ontologia: ambiguidade e precisão

    No full text
    A ambiguidade é um grande obstáculo para a recuperação de informação. Tanto que ela é fonte de várias pesquisas na Ciência da Informação. As ontologias têm sido estudadas com foco na resolução de problemas oriundos de tais ambiguidades. Paradoxalmente, o termo “ontologia” é ambíguo e apresenta diferentes sentidos de acordo a comunidade que o utiliza. A Filosofia e a Ciência da Computação, talvez, possuam a maior divergência em relação ao significado do termo. A primeira possui séculos de tradição e autoridade incontestáveis. A segunda, bem mais recente, apresentou definições com sentido mais informal, porém pragmático. A Ciência da Informação busca ordenar acervos visando o equilíbrio entre usuário e informação e, para tal, se vale de abordagens filosóficas e computacionais. A Web Semântica demanda a automação do ciclo informacional e abre espaço para pesquisa em ontologias. Logo, é importante revisitar abordagens variadas de tal forma que elas forneçam noções úteis aos pesquisadores da área sem, contudo, abandonar o rigor filosófico, nem o pragmatismo característico da computação

    Ontology lexicalization: Relationship between content and meaning in the context of Information Retrieval

    No full text
    Abstract The proposal presented in this study seeks to properly represent natural language to ontologies and vice-versa. Therefore, the semi-automatic creation of a lexical database in Brazilian Portuguese containing morphological, syntactic, and semantic information that can be read by machines was proposed, allowing the link between structured and unstructured data and its integration into an information retrieval model to improve precision. The results obtained demonstrated that the methodology can be used in the risco financeiro (financial risk) domain in Portuguese for the construction of an ontology and the lexical-semantic database and the proposal of a semantic information retrieval model. In order to evaluate the performance of the proposed model, documents containing the main definitions of the financial risk domain were selected and indexed with and without semantic annotation. To enable the comparison between the approaches, two databases were created based on the texts with the semantic annotations to represent the semantic search. The first one represents the traditional search and the second contained the index built based on the texts with the semantic annotations to represent the semantic search. The evaluation of the proposal was based on recall and precision. The queries submitted to the model showed that the semantic search outperforms the traditional search and validates the methodology used. Although more complex, the procedure proposed can be used in all kinds of domains

    Descoberta de Conhecimento em Texto aplicada a um Sistema de Atendimento ao Consumidor

    No full text
    Analisa um Serviço de Atendimento ao Consumidor de instituição financeira que centraliza, em forma textual, os questionamentos, as reclamações, os elogios e as sugestões, verbais ou escritas, de clientes. Discute a complexidade da informação armazenada em linguagem natural e oferece alternativa para extração de conhecimento de bases textuais com a criação de agrupamentos e modelo de classificação automática de textos para agilizar a tarefa realizada atualmente por pessoas. Apresenta uma revisão de literatura que mostra a Descoberta de Conhecimento em Texto como uma extensão da Descoberta de Conhecimento em Dados que utiliza técnicas do Processamento de Linguagem Natural para adequar o texto ao formato apropriado para a mineração de dados e destaca a importância do processo na Ciência da Informação. Aplica a Descoberta de Conhecimento em Texto na base do Serviço de Atendimento ao Consumidor com objetivo de criar automaticamente agrupamentos de documentos para posterior criação de um modelo categorizador automático dos novos documentos recebidos diariamente. Essas etapas são validadas por especialistas de domínio que atestam a qualidade dos agrupamentos e do modelo. Finalmente, geram-se indicadores de desempenho do grau de satisfação do cliente referente a produtos e serviços oferecidos que subsidiam a gestão na política de atendimento
    corecore